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(57) Abstract 

The invention concerns a speech-processing system which 
comprises an optional number of speech-recognition modules (Ei, i 
= l..n) and speech-output modules (Aj, j ~ l..m). Depending on the 
application, the modules, which are each provided for a given type 
of speech recognition or speech output, are selected, activated and 
parametrized by a module-selection device (MA) as a function of an 
input signal (ES), such that the selected modules are used according to 
their respective configuration for speech-recognition or speech-output 
purposes. 

(57) Zusammenfassung 

Ein Sprachverarbeitungssystem weist eine beliebige Anzahl von 
Spracherkennungsmodulen (Ei, i - l..n) und Sprachausgabemod- 
ulen (Aj, j l..m) auf. Die jeweils fur eine bestimmte Art der 
Spracherkennung bzw. Sprachausgabe vorgesehenen Module wer- 
den je nach Anwendungssituation abhangig von einem Eingabes- 
ignal (ES) von einem Mittel (MA) zur Auswahl der Module aus- 
gewahlt und aktiviert und parametrisiert, so daB die ausgewahlten 
Module entsprechend ihrer Ausgestaltung zur Spracherkennung bzw. 
Sprachausgabe verwendet werden. 
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Beschreibung 

5 

Sprachverarbeitungssystera und Verfahren zur Sprachverarbei- 
tung 

In ublichen Sprachverarbeitungssystemen beispielsweise fur 
10 telefonbasierte Anwendungen werden verschiedenste Moglichkei- 
ten der sprachlichen Eingabe und Ausgabe angeboten. Dies 
reicht von der Erkennung von einzeln gesprochenen Ziffern und 
einer meist begrenzten Anzahl von Kommandowortern bis zur 
Eingabemoglichkeit fliefiend gesprochener Aufierungen. Die Aus- 
15 gabemoglichkeiten reichen vom Ausgeben komplett auf genommener 
Aufterungen bis zu rein synthetisch erzeugter akustischer Aus- 
gabe von Texten aus beispielsweise abgespeicherten Phonemen . 

Anwendungen von Sprachverarbeitungssystemen im industriellen, 
20 offentlichen sowie im privaten Bereich sind mit sehr unter- 
schiedlichen Anf orderungen sowohl an die Spracheingabe als 
auch an die Sprachausgabe konf rontiert . Dies ist bedingt 
durch die Vielfalt der Anwendungsmoglichkeiten und der damit 
von den Sprachverarbeitungssystemen zu losenden sprachlichen 
25 Aufgaben. 

Dies gilt ebenso fur Sprachdialogsysteme, bei denen das 
Sprachverarbeitungssystem mit dem Benutzer des Sprachverar- 
beitungssystems in einem beliebig ausgestalteten Dialog 
30 steht. 

Bei einer Anwendung im Bereich von Sprachverarbeitungssyste- 
men kann es beispielsweise erforderlich sein, dafi zu einem 
Zeitpunkt vom Benutzer eine Ziffer einzeln abgefragt wird, zu 
35 einem anderen Zeitpunkt innerhalb desselben Dialoges aber von 
dem Benutzer ein Datum eingegeben werden kann und vom Sprach- 
verarbeitungssystem verarbeitet werden soil. 
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Ebenso kann bei der Ausgabe an einer Stelle die Ausgabe einer 
Sprachkonserve ausreichend sein, wahrend an anderer Stelle 
eines Anwendungsszenarios durch die hohe Variabilitat des 
5 auszugebenden Textes eine Sprachsynthese geeigneter ist. 

Desweiteren konnen zu verschiedenen Zeitpunkten verschiedene 
Leistungsmerkmale von Spracherkennern vom Betreiber als er- 
forderlich erachtet werden, wie z* B. die Unterbrechbarkeit 
10 der Systemausgabe wunschenswert sein kann, wohingegen an an- 
derer Stelle jedoch der Benutzer die Ausgabe vollstandig an- 
horen sollte. 

Urn eine moglichst effiziente Verwendung der spezialisiert en, 
15 bekannten Algorithmen zur Spracherkennung und zur Sprachaus- 
gabe und auch Sprachdialogsysteme mit komplexeren Erken- 
nungseigenschaften und Ausgabeeigenschaf ten als beispielswei- 
se zur einfachen Zif f ernerkennung oder nur zur isolierten Er- 
kennung von einer kleinen Anzahl von Kommandowortern, war es 
20 bisher tiblich, die Systeme in einer Weise zu erstellen, daii 

durch die besondere Auswahl von technischen Methoden und spe- 
zifischen sof twaret echnischen Mafinahmen den spezifischen An- 
forderungen an die Spracherkennung bzw. an die Sprachausgabe 
Rechnung getragen wurde. 

25 

Dies erfordert jedoch einen groften personellen Aufwand von 
Experten, die fur jede neue Anwendungssituation in der Regel 
neu zu erbringen ist . Durch diese Vorgehensweise wird eine 
effiziente wirtschaf tliche Nutzung von Sprachverarbeitungssy- 
30 stemen erheblich behindert. 

Im Telefonbereich existieren Dialogsysteme, bei denen eine 
Auswahl beispielsweise uber sog. DTMF-Tone und einfache Nen- 
nung von Ziffern oder einiger, weniger vorgegebener Komando- 
35 worte erf olgt . 
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Jedoch ist der Aufwand fur eine neue Entwicklung eines 
Sprachverarbeitungssystems bzw. eines Sprachdialogsystems mit 
den bisherigen Verfahren und Systemen sehr aufwendig. 

5 Aus [3] ist ein Verfahren zur Verbesserung der Spracherken- 
nung unter Berucksichtigung verschiedener digitaler Codierbe- 
dingungen bekannt . Dabei wird fur eine Mehrzahl von Spracher- 
kennungsmodulen, die alle den gleichen Spracherkennungsalgo- 
rithmus verwenden, jedoch moglichst optimal adaptiert an un- 
10 terschiedeliche Kanalcodierungsverf ahren far empfangene Si- 

gnale das jeweils verwendete Kanalcodierungsverf ahren erkannt 
und das jeweilig entsprechende Spracherkennungsmodul ausge- 
wahlt . 

15 Aus [6] ist ein Verfahren und eine Anordnung zur Generierung 
einer Vielzahl elektrischer Signale bekannt. Bei dieser An- 
ordnung werden eine Vielzahl von Sprachausgabeeinheiten glei- 
chen Aufbaus miteinander kombiniert zu der Gesamtanordnung. 

20 Somit liegt der Erfindung das Problem zugrunde, ein Sprach- 
verarbeitungssystem sowie ein Verfahren zur Sprachverarbei- 
tung anzugeben, mit dem eine optimale, kontextangepaftte Nut- 
zung von Spracherkennungsmodulen und/oder Sprachausgabemodu- 
len unter Verminderung benotigter Rechenkapazitat erreicht 

25 wird. 

Das Problem wird durch das Sprachverarbeitungssystem gemaii 
Patentanspruch 1 sowie durch das Verfahren gemaii Patentan- 
spruch 8 gelost . 

30 

Das Sprachverarbeitungssystem weist mehrere Spracherkennungs- 
module und/oder Sprachausgabemodule auf, die jeweils fur eine 
vorgebbare Art einer Spracherkennung bzw. einer Sprachausgabe 
vorgesehen sind. Ferner weist das Sprachverarbeitungssystem 
35 ein Mittel zur Auswahl eines Spracherkennungsmoduls und/oder 
Sprachausgabemoduls auf . Durch das Mittel wird abhangig von 
einem Eingabesignal , welches dem Mittel zugefuhrt wird, das 
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jeweilige Spracherkennungsmodul bzw. Sprachausgabemodul aus- 
gewahlt, aktiviert und das entsprechende Sprachsignal bzw. 
die erf orderlichen Parameter werden dem jeweiligen Modul zu- 
gefuhrt. Die Spracherkennung bzw. die Sprachausgabe wird dann 
5 von dem jeweiligen Modul ausgefuhrt. 

Bei dem Verfahren wird ein Eingabesignal analysiert mit dem 
beschrieben wird, welche Art von Spracherkennung bzw. Sprach- 
ausgabe benotigt wird. Abhangig von dem Eingabesignal wird 

0 mindestens ein Spracherkennungsmodul und/oder mindestens ein 
Sprachausgabemodul fur die jeweils durch das Eingabesignal 
beschriebene Spracherkennung bzw. Sprachausgabe, aktiviert. 
Mit dem jeweils ausgewahlten bzw. aktivierten Modul wird die 
jeweilige Art der Spracherkennung bzw. Sprachausgabe durchge- 

5 f uhrt . 

Sowohl das Sprachverarbeitungssystem als auch das Verfahren 
weisen eine Vielzahl erheblicher Vorteile gegenuber dem Stand 
der Technik auf. 

0 

Der Bedarf an Rechenkapazitat bzw. an Verarbeitungsressourcen 
fur die Spracherkennung bzw. zur Sprachausgabe wird erheblich 
reduziert, da abhangig von der jeweils benotigten Anwendungs- 
situation das fur die Situation optimal angepaiite Modul zur 
5 Spracherkennung bzw. zur Sprachausgabe verwendet wird. 

Auch bei der Erstellung von Sprachdialogsystem ist das 
Sprachverarbeitungssystem zur Entwicklungsunterstut zung sehr 
vorteilhaft einsetzbar. Besondere Vorteile bietet dieses 
0 Sprachverarbeitungssystem in diesem Bereich, da eine schnelle 
und einfache Anpassung der vorhandenen technischen Spracher- 
kennungsverf ahren und Sprachausgabeverf ahren an die jeweili- 
gen spezifischen Erf ordernisse der Anwendungs situation mog- 
lich ist. 

5 

Weiterhin wird eine flexible, der spezifischen Dialogssitua- 
tion angepaiite Nutzung von deren unterschiedlichen Fahigkei- 
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ten und Leistungsmerkmalen erreicht . Auch ist eine flexible 
Anpassung der Spracherkennungsleistung und Sprachausgabelei- 
stung an die bei den Benutzern in der spezifischen Dialogsi- 
tuation verfiigbaren Ressourcen, beispielsweise der verfiigba- 
5 ren Rechnerkapazitat moglich. 

Somit stellt das Sprachverarbeitungssystem ein bedeutendes 
Mittel dar zur bedarf sgerechten Konf iguration und Anpassung 
von Spracheingabe und Sprachausgabe in verschiedensten Anwen- 
0 dungssituationen . 

Vorteilhafte Weiterbildungen der Erfindung ergeben sich aus 
den abhangigen Anspruchen. 

5 Es ist in einer Weiterbildung des Sprachverarbeitungssystems 
sehr vorteilhaft, bestimmte Algorithmen, also bestimmte Teil 
der Module gemeinsam zu verwenden, wodurch eine redundante 
Realisierung lediglich eigentlich nur einmal benotigter Algo 
rithmen vermieden wird. 

0 

Auch ist eine vorteilhafte Weiterbildung darin zu sehen, daft 
mehrere Spracherkennungsmodule gemeinsame Resourcen verwen- 
den, beispielsweise gemeinsame Lexika fur die Spracherken- 
nung. Dies fuhrt zu einer erheblichen Einsparung von Ressour 
25 cen, z. B. von Speicherbedarf . 

Weiterhin ist es vorteilhaft, eine Dialoglauf steuerung vorzu 
sehen, mit der ein Dialog des Sprachverarbeitungssystems mit 
einem Benutzer realisiert werden kann. 

30 

Ein Ausfuhrungsbeispiel der Erfindung ist in den Figuren dar 
gestellt und wird im weiteren naher erlautert. 

Es zeigen 

35 Fig. 1 das Sprachverarbeitungssystem mit einigen Weiter- 
bildungen; 

Fig. 2 ein Blockdiagramm, in dem die Dialogablauf- 
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steuerung dargestellt ist; 
Fig. 3 ein Ablauf diagramm, in dem ein mogliches Verfahren, 
welches zur Dialogablauf steuerung durchgefuhrt 
wird, dargestellt ist; 
5 Fig. 4 ein Ablauf diagramm, in dem das erf indungsgemalie 
Verfahren dargestellt ist. 

In Fig. 1 ist das Sprachverarbeitungssystem dargestellt. Das 
Sprachverarbeitungssystem weist mindestens ein Spracherken- 
10 nungsmodul El, E2, Ei, . En auf. Mit einem Index i, einer 
beliebigen Zahl zwischen 1 und n, wird jeweils das Spracher- 
kennungsmodul Ei eindeutig gekennzeichnet . Mit n wird eine 
Anzahl von Spracherkennungsmodulen in dem Sprachverarbei- 
tungssystem bezeichnet . 



15 



20 



35 



Ferner weist das Spracherkennungssystem zusatzlich oder al- 
ternativ mindestens ein Sprachausgabemodul Al, A2, A j , . .., 
Am auf. Mit einem zweiten Index j, einer beliebigen Zahl zwi- 
schen 1 und m, wird jedes Sprachausgabemodul Aj eindeutig ge- 
kennzeichnet. Mit m wird eine Anzahl von Sprachausgabemodulen 
in dem Sprachverarbeitungssystem bezeichnet. 



Ferner weist das Sprachverarbeitungssystem ein Mittel MA zur 
Auswahl der Spracherkennungsmodule Ei bzw. der Sprachausgabe- 

25 module Aj auf. Das Mittel MA zur Auswahl der Module ist mit 

den einzelnen Modulen Ei, Aj gekoppelt, so daft von dem Mittel 
MA zur Auswahl der Module Ei, Aj an die einzelnen Module Ei, 
Aj Signale gesendet werden konnen, beispielsweise zur Akti- 
vierung der einzelnen Module Ei, Aj oder auch zur tJbergabe 

30 von Parametern, die von den einzelnen Modulen zur Durchfuh- 

rung der Spracherkennung oder der Sprachausgabe benotigt wer- 
den . 



Spracherkennungsmodule Ei 

Grundlagen uber die Spracherkennung sind beispielsweise in 
den Dokumenten [1] und [2] beschrieben. 
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Die einzelnen Spracherkennungsmodule El, E2, . En sind Mo- 
dule, die jeweils auf eine bestimmte Art der Spracherkennung 
spezialisiert sind . 

5 

Die einzelnen Spracherkennungsmodule Ei konnen beispielsweise 
durch Hardware oder auch durch einzelne Sof twareprozeduren 
realisiert sein. 

10 Im folgenden wird eine keineswegs abschlieflend zu betrachten- 
de Ubersicht ttber vorgesehene Spracherkennungsmodule Ei gege- 
ben, die im Rahmen des Sprachverarbeitungssystems verwendet 
werden konnen. 

15 - Einzelzif f ernerkenner 

1st ein Spracherkennungsmodul Ei als ein Einzelzif fererkenner 
ausgebildet, so ist es derart ausgestaltet , als Eingabe ein 
einzelnes, vom Benutzer B des Sprachverarbeitungssystems ein- 
gesprochenes Sprachsignal, welches eine einzige Ziffer repra- 

20 sentiert, aus einer Auswahl von Ziffern, zu verarbeiten .. Da- 
bei unterscheiden sich die Einzelzif f ernerkenner ublicherwei- 
se in der Modellierung der akustischen Muster. Es sind Syste- 
me bekannt, in denen von verschiedenen Sprechern die akusti- 
schen Muster fur ein ganzes Wort gespeichert werden und mit- 

25 tels Vergleichsverf ahren wie dem sog. Dynamic Programming 

oder dem Dynamic Time Warping oder auch unter Verwendung neu- 
ronaler Netze beim Erkennungsvorgang das am besten passende 
Wort ermittelt wird. Andere bekannte Module zur Einzelzif fer- 
nerkennung basieren auf dem Prinzip der Hidden-Markov- 

30 Modelle. Bei diesen Prinzip der Einzelzif fernerkennung wird 
die Lautfolge der von mehreren Sprechern gesprochenen Worter 
als Zustandsfolge mit Variable und vorgegebener Lange abge- 
speichert. Bei der Erkennung der Worter, in diesem Fall der 
Ziffer, wird der geringste Abstand zu der abgespeicherten 

35 Wortfolge ermittelt. Bei Varianten dieses Prinzips werden in 
Hidden-Markov-Modellen die Folgen der einzelnen phonetischen 
Einheiten abgespeichert , die aus den Daten mehrerer Sprecher 
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gewonnen werden, in der Regel Ziffern. Zur Verminderung beno- 
tigter Rechenkapazitat kann bei einem Einzelzif f ernerkenner 
ausgenutzt werden, daft auf keine der gespeicherten lautlichen 
Folgen eine weitere Folge auftreten kann. Aus diesem Grund 
5 ist in diesem Fall keine rechenaufwendige Detektion von Wor- 
grenzen erf orderlich . Auch ist der zu untersuchende Wort- 
schatz relativ gering, da lediglich die Ziffern untersucht 
werden miissen. 

0 - Zif f ernkettenerkenner 

Ist ein Spracherkennungsmodul Ei als Zif f ernkettenerkenner 
ausgestaltet, so ist das Spracherkennungsmodul in der Regel 
mit Erkennern fur kontinuierliche Sprache gleichzuset zen . Ei- 
ne Anzahl von in einem digitalen Lexikon definierten, vorgeb- 

5 baren Wortern, in diesem - Spezialf all Ziffern, kann in belie- 
biger Reihenfolge hintereinander von einem Benutzer B des 
Sprachverarbeitungssystems geauJiert werden. Flir diesen Fall 
ist eine Detektion der Grenzen zwischen den einzelnen Worten 
erf orderlich. Dies kann entweder durch ein Verfahren zur ex- 

0 pliziten Detektion der Wortgrenzen erfolgen, oder die Wort- 
grenzen werden von dem Algorithmus der Wortsuche f estgelegt . 
Bei der Wortsuche werden parallel alle Ziffern im Eingabesi- 
gnal untersucht und verschiedene Enden hypothet isiert . An je- 
dem Ende kann im Signal eine weitere Ziffer gesucht werden. 

5 Dazu wird ein Suchraum aufgebaut, der die verschiedenen Al- 
ternativen gleichzeitig verfolgt und sie nach vorgebbaren 
Qualitatskriterien ordnet. In diesem Zusammenhang kann bei- 
spielsweise das Prinzip der Dynamischen Pro grammie rung ver- 
wendet werden, wie es in dem Dokument [1] beschrieben ist. 

0 Ein solches Kriterium kann der Abstand der beobachteten Teile 
des Signals zu den Ref erenzmustern, den einzelnen gespeicher- 
ten Ziffern sein. Zif f ernkettenerkenner zeichnen sich in der 
Regel von kontinuierlichen Erkennern in der besonderen Art 
der Modellierung der akustischen Ref erenzmuster aus, bei de- 

5 nen bei der Ziffer eine spezifische Artikulationsweise oder 
typische Langen der einzelnen Ziffern ausgenutzt werden. 
Durch eine Modellierung von Sprachpausen oder durch ein Ent- 
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scheidungskriterium, z. B. die im Signal sichbare Energie, 
kann in unterschiedlichen Heuristiken das Ende einer solchen 
Folge detektiert werden. 

5 - Erkennung von Wortern aus einem begrenzten Vokabular 

1st ein Spracherkennungsmodul Ei als ein Spracherkenner fiir 
bestimmte haufige Kommandoworte aus einem begrenzten Vokabu- 
lar, dem sog. Kernvokabular ausgestaltet , so werden algorith- 
misch die entsprechenden Verfahren angewendet wie auch zur 

10 Einzelzif f ernerkennung, jedoch mit dem Unterschied, daJi das 
Vokabular um die entsprechenden Worte erweitert ist bzw. dafi 
sich das Vokabular, mit den entsprechenden gespeicherten Re- 
prasentanten der einzelnen Worte von den Ziffern unterschei- 
det. Das speziell erweiterte bzw. ersetzte Vokabular ist fiir 

15 den Spracherkenner vorgegeben und in der Regel mit einer gro- 
fceren Anzahl von Sprechern trainiert. 

- Erkennung eines Einzelwortes aus einem unbegrenzten Vokabu- 
lar 

20 Zur Erkennung flieliend gesprochener Sprache mit einem unbe- 
grenzten Vokabular ist ein Spracherkennungsmodul Ei derart 
ausgestaltet, daJi die Worte des Vokabulars dem Spracherken- 
nungsalgorithmus, der in dem Spracherkennungsmodul Ei reali- 
siert wird, nicht bekannt sind, sondern von einem Benutzer B 

25 zuvor bestimmt werden. Der Algorithmus zur Spracherkennung 

basiert ublicherweise auf der Erkennung einer Folge von laut 
lichen Einheiten, den sog. Phonemen oder anderen Wortunter- 
einheiten, aus denen sich die Worte des zu erkennenden Voka- 
bulars zusammensetzen lassen. In dem Lexikon des Spracherken 

30 nungsmoduls Ei werden in einem Speicher die das jeweilige 
Wort kennzeichnenden lautlichen Folgen abgespeichert . Die 
Laute konnen in ihrer Modellierung auch noch weitere Unter- 
einheiten, wie z. B. Beginn des Phonems, Mitte des Phonems, 
Ende des Phonems, tibergang des Phonems, etc. aufweisen. Das 

35 Spracherkennungsverfahren sucht aus dem beobachteten Sprach- 
signal wiederum die Folge mit dem geringsten Abstand zu den 
Ref erenzdaten auf. Der Einzelworterkenner kann algorithmisch 
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den Umstand ausnutzen, dafi auf keine clar im Inventar abgeleg- 
ten lautlichen Folgen eine weitere Folge auftreten kann. 

- Erkennung fliefiend gesprochener Sprache mit einem unbe- 
5 grenzten Vokabular 

1st ein Spracherkennungsmodul Ei zur Erkennung fliefiend ge- 
sprochener Aufterungen des Benutzers mit einem unbegrenzten 
Vokabular ausgestaltet , so unterscheidet sich das Spracher- 
kennungsmodul Ei von einem Spracherkennungsmodul Ei zur Zif- 

10 fernkettenerkennung in der Regel in der Art der Modellierung 
der lautlichen Einheiten. 1st das lexikalische Inventar, also 
das Vokabular, unbegrenzt, was auch als ein offenes lexikali- 
sches Inventar bezeichnet wird, erfolgt die akustische Model- 
lierung meist auf lautlichen Einheiten, den Phonemen, oder 

15 auf Wortuntereinheiten, aus denen sich das zu erkennende Vo- 
kabular zusammensetzen laftt . Ebenso wie bei dem Spracherken- 
nermodul Ei fur kont inuierliche Ziffern werden bei dieser 
Ausgestaltung des Spracherkennungsmoduls die Grenzen zwischen 
den Wortern durch eine geeignete Suche bestimmt . Dies erfolgt 

20 beispielsweise durch eine Modellierung von Sprachpausen oder 
durch ein Entscheidungskriterium, z. B. die im Signal sicht- 
bare Energie. Das Spracherkennungsmodul kann die wahrschein- 
lichste, oder mit Erweiterungen im Suchalgorithmus eine vor- 
gebbare Anzahl wahrscheinlichster Folgen von Wortern ausge- 

25 ben. Die Suche bei kontinuierlichen Spracherkennungsmodulen 
wird meistens durch eine Modellierung der fur einen bestimm- 
ten Sprachausschnitt typischen oder moglichen Wortfolgen, den 
sog. Language-Modellen unterstutzt. Unter Language-Modellen 
sind beispielsweise grammatische Modellierungen der Wortfol- 

30 gen oder Wortlisten oder statistische Modellierungen im Sinne 
einer sog. N-Gram-Analyse zu verstehen. 

- Erkennung von vorgegebenen Wort kombinationen 
Zur Erkennung von vorgegebenen Wortkombinationen ist ein 
35 Spracherkennungsmodul Ei derart ausgestaltet , dali beispiels- 
weise Datumsangaben, Uhrzeitangaben, Mafiangaben, Zahlenanga- 
ben, etc. als spezielles Vokabular verwendet werden. Bei die- 
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sen Spracherkennungsmodulen Ei handelt es sich iiblicherweise 
um Spracherkennungsmodule Ei fur kontinuierliche Sprache, de- 
ren lexikalisches Inventar aber auf die vorgegebenen Wortkom- 
binationen aus den jeweiligen Bereichen, wie beispielsweise 
5 eine Datumsangabe oder eine Mafiangabe zugeschnitten ist. Des 
weiteren kann die Wortf olgensuche durch eine Modellierung der 
moglichen Wortfolgen wie bei einem kontinuierlichen Spracher- 
kennungsmodul Ei unterstiitzt werden, wobei sich diese Model- 
lierung dadurch auszeichnet, dali sie im wesentlichen die zu 
10 erwartenden Ausdrucksweisen in einem dieser sprachlichen Un- 
tergebiete, z. B. Datumsangabe, besonders berucksicht igt . 

- Schliisselwort erkennung 

Bei einem Spracherkennungsmodul Ei zur Schliisselworterkennung 
15 konnen in einem Spracheingabesignal ein oder mehrere vorgege- 
bene Worte, die in einem Lexikon zuvor gespeichert wurden, 
detektiert werden. Die verschiedenen Moglichkeiten zur Ausge- 
staltung der Spracherkennungsmodule zur Schliisselworterken- 
nung sind beispielsweise in dem Dokument [4] beschrieben. 

20 

- Erkennung von Schlusselwortkombinationen 

Zur Erkennung von Schlusselwortkombinationen wird das gleiche 
Prinzip wie zur Erkennung von Schlusselworten verwendet, mit 
dem Unterschied, daii vordef inierte Wortketten in einem belie- 
25 bigen Eingabesignal ES detektiert werden konnen. Die Wortket- 
ten konnen entweder explizit als Ref erenzdaten abgespeichert 
werden oder durch andere Verfahren, beispielsweise Language- 
Modelle oder Grammatiken beschrieben werden. 

30 - Alphabeterkennung 

Ist ein Spracherkennungsmodul Ei als eine Alphabeterkennungs- 
einrichtung ausgestaltet , so werden iiblicherweise die Buch- 
staben mit besonderen akustisch phonetischen Modellen be- 
schrieben. Als lexikalische Einheiten, die in einem Speicher 

35 des Sprachverarbeitungssystems vorgesehen sind, werden in 

diesem Fall im wesentlichen die Buchstaben des Alphabets ver- 
wendet . Ein Alphabeterkenner kann beispielsweise als Einzel- 
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worterkenner das isolierte Alphabet oder auch als kontinuier- 
licher Erkenner fur eine fliefiende Buchstabierung realisiert 
sein. Bei kontinuierlichen Alphabeterkennern kann durch Lan- 
guage-Modelle oder auch durch Grammatiken die Suche der tat- 
5 sachlichen Wortfolgen unterstutzt werden. 

- Lautf olgeerkennung 

Ein Spracherkennungsmodul Ei zur Lautf olgenerkennung zeichnet 
sich dadurch aus, dafi die akustischen Einheiten auf phoneti- 

10 sche Einheiten modelliert werden und die zu erkennenden Laut- 
folgen nicht durch ein Lexikon beschrankt sind. Lautf olgener- 
kenner bzw. Phonexnerkenner beruhen auf akust isch-phonetischen 
Modellierungen der Laute einer Sprache . Mit dem phonetischen 
Inventar wird die Suche in dem akustischem Sprachsignal 

15 durchgefuhrt . Hypothet isiert wird eine beliebige Kette von 

Lauten. In der akustischen Analyse werden verschiedene Heuri- 
stiken verwendet, urn ein zu schnelles Wechseln der hypotheti- 
sierten Laute, den Phonemen, in einer Aufierung zu verhindern. 
Zusatzlich kbnnen als Einschrankungen der zu erkennenden 

20 Lautfolgen im Sinne von Language-Modellen phonetische Gesetz- 
mafrigkeiten einer Sprache berucksichtigt werden. 

- DTMF-Erkennung 

Eine DTMF-Erkennung ist aus verschiedensten Bereichen der te- 
25 lefonischen Spracherkennung bekannt. 

Als Sprachausgabemodule Aj konnen verschiedene bekannte Prin- 
zipien zur Realisierung verschiedener Sprachausgabeprinzipien 
verwendet werden: 

30 

- Ausgabe vorgegebener, gespeicherter Sprachkonserven 

Ist ein Sprachausgabemodul Aj zur Ausgabe vorgegebener, ge- 
speicherter Sprachkonserven ausgestaltet , so werden Sprachau- 
fierungen, die vorher von einer beliebigen Person eingespro- 
35 chen, aufgenommen und digitalisiert abgespeichert wurden, 

iiber einen beliebigen akustischen Kanal ausgegeben. Die auf- 
genommenen Aufterungen konnen hierbei die kompletten auszuge- 
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benden Aufterungen sein, die jeweils far eine bestimmte Situa- 
tion vorgesehen sind, Oder aber auch Bruckstacke davon, die 
zur Laufzeit wieder zu kompletten Aufterungen zusammengesetzt 
werden. Ein typisches Beispiel hierfur ist die Bildung von 
5 Zif f ernketten, deren Lange und Zusammenset zung in den meisten 
Anwendungsf alien nicht vorhersehbar ist. Es konnen jedoch je 
nach Kontext verschiedene intonatorische Varianten ein und 
derselben Aufterung vorliegen und in einem Sof twareprogramm 
entsprechend dem aktuellen Kontext ausgewahlt werden. Ferner 
10 sind verschiedene Methoden anwendbar, die eine sog. akusti- 

sche Glattung der verwendeten Konserven an den Ubergangen der 
Konkatenation der einzelnen Sprachkonserven in verschieden- 
ster Form vornehmen konnen. 

15 - Ausgabe von aus gespeicherten Phonemen synthetisierten Wor- 
ten 

Mogliche Realisierungen zur Ausgest altung von Sprachausgabe- 
modulen zur Synthese von gespeicherten Phonemen zu syntheti- 
sierten Worten sind in dem Dokument [5] beschrieben. 

20 

Das Mittel MA zur Auswahl der in einem Anwendungsszenario je- 
weils zu verwendenden Spracherkennungsmodule Ei bzw. Sprach- 
ausgabemodule Aj ist derart ausgestaltet , daft abhangig von 
einem dem Mittel MA zugefuhrten Eingabesignal ES mindestens 

25 eines der Spracherkennungsmodule bzw. der Sprachausgabemodule 
aktiviert wird und, soweit es erforderlich ist, den einzelnen 
Spracherkennungmodulen Ei bzw. Sprachausgabemodulen Aj Para- 
meter, die im weiteren Verfahren zur Spracherkennung bzw. zur 
Sprachausgabe erforderlich sind, zugefuhrt werden. Die ent- 

30 sprechenden Paramter konnen beispielsweise darin zu sehen 

sein, daft den Spracherkennungsmodulen Ei bzw. den Sprachaus- 
gabemodulen Aj Ressourcen zugewiesen werden oder auch bei- 
spielsweise die Speicheradressen der verwendeten digitalen 
Lexika zugefuhrt werden. 

35 

In diesem Ausfuhrungsbeispiel werden die Ergebnisse, also die 
ausgegebenen Sprachsignale aus den Sprachausgabemodulen Aj 
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dem Mittel MA zugefuhrt, und beispielsweise uber einen Aus- 
gang AS des Sprachverarbeitungssystems dem Benutzer B ausge- 
geben. Ein von einem Benutzer B gesprochenes Sprachsignal 
wird uber einen Eingang E, beispielsweise realisiert durch 
5 einen Mikrophon, dem Mittel MA zugefuhrt, und Qber das Mittel 
MA abhangig von den jeweils aktivierten Spracherkennungsmodu- 
len Ei, den jeweils aktivierten Spracherkennungsmodul Ei zu- 
gefuhrt. 

10 Die einzelnen Module Ei, Aj verwenden u. a. Wissensquellen, 
beispielsweise digitale Lexika, allgemeine Daten, die in ei- 
nem Speicher des Sprachverarbeitungssystems gespeichert sind. 
Unter den Wissensquellen sind beispielsweise auch auf die je- 
weilige Spracherkennungsauf gabe spezialisierte akustischer 

15 Modelle, z. B. ein Einzelworterkenner mit Lautmodellen oder 
Einzelworterkenner mit akustischen Modellen ftir beliebige 
Worter, zu verstehen. Die Wissensquellen konnen aber auch die 
von den Erkennern fiir einen gegebenen Dialogschritt in einem 
Dialogsystem zur Auswahl stehenden spezifischen Wortschatze 

20 sein, oder fur bestimmte, erwartete eingabespezif ische sog. 
Sprachmodelle . 

Das von den Spracherkennungsmodulen Ei verwendete Vokabular 
ist beliebig durch orthographische, d. h. sprecherunabhangi- 
25 ge, oder sprachliche, d. h. sprecherabhangige, Eingabe sowohl 
bei der Erstellung als auch aktuell zur Laufzeit des Sprach- 
verarbeitungssystems erweiterbar und damit an wechselnde An- 
forderungen anpalibar, 

30 Durch geeignete Lernverf ahren konnen die Wissensquellen wah- 
rend des Betriebs des Sprachverarbeitungssystems durch eine 
Auswertung der laufenden Eingabedaten modifiziert und der be- 
sonderen Nutzungs- und Anwendungssituation angepaftt werden. 

35 Weiterhin kann ein Parameter, der den Spracherkennungsmodulen 
Ei oder den Sprachausgabemodulen Aj zugefuhrt wird darin zu 
sehen sein, daft mit dem Parameter angegeben wird, ob selbst 



WO 98/10413 



PCT/DE97/01920 



15 

wahrend einer Sprachausgabe von dem Benutzer B gesprochene 
Sprachsignale bearbeitet und von dem Sprachverarbeitungssy- 
stem auf genommen werden konnen. 

Im folgenden wird anhand eines sehr einfachen Beispiels fur 
eine Dialogsituation eine Ausgestaltung des Sprachverarbei- 
tungssystems als Sprachdialogsystem dargestellt . 

In der folgenden Darstellung in einem Pseudo- 
Nachrichtenf luAdiagramm wird jeweils zu Beginn einer Zeile 
auf der linken Seite eines Pfeils der Sender eines bestimmten 
Signals und auf der rechten Seite eines Pfeils der Empfanger 
des Signals, das im weiteren in dieser Zeile angegeben ist, 
beschrieben . 

In diesem Beispiel wird ohne Einschrankung der Allgemeinheit 
von einer Weiterbildung, welche im weiteren beschrieben wird, 
ausgegangen, namlich einer Dialogablauf steuerung DA. 

DA -> MA: GebeAus ( "Bitte nennen Sie Ihre Nummer nach dem 
Piepton" ) 

MA — » Al : PlayPromptFile (Bitte_nennen_Sie_Ihre_Nummer_nach_ 

dem_Piepton) 
Al -> MA: PlayPromptFinished 
MA -> DA: AusgabeComplete 

DA — > MA: ErkenneAufterung (Domane=Zif f em, Anzahl max. =5) 
MA -> El: StarteErkennung (Modus=Einzelzif f er, 

Lexikon=Digits ) 
MA -» E2: StarteErkennung (Modus=kontinuierliche 

Zif f ernerkennung, Lexikon= Digits) 
El -» MA: ErkenneAusgabe (Modus=Einzelzif fer, Resultat=0) 
E2 -> MA: ErkenneAusgabe (Modus=kontinuierliche Zif fern, 

erkannte Zif f ernf olge : 12 3 4 5) 



MA DA: EingabeZiff ernf olge : (12 3 4 5) 
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DA — > MA : GebeAus ( "Ihre Nummer ist 1 2 3 4 5") 
DA Al: PlayPromptFile ( Ihre_Nummer_ist ) 
MA — » A2 : Synthesise (Zif f ernfolge 12 3 4 5) 
Al -» MA: PlayPrompt Finished 
A2 -» MA: Synthesise Finished 
MA -> DA: AusgabeComplete 

DA -> MA: GebeAus ( "Mochten Sie Vertrieb oder Kundenservice 
sprechen?" ) 

MA — > Al : PlayPromptFile (M6chten_Sie_Vertrieb_oder_ Kun- 
denservice- sprechen ) 

Al -» MA: Prompt file not available 

MA -» A2: Synthesise (Mochten Sie Vertrieb oder Kundenservice 
sprechen? ) 

A2 -» MA: Synthesis finished 
MA -» DA: Ausgabe complete 

DA DM: ErkenneSprache (Domane=Vertrieb__oder_Kundenservice) 
MA — » E3 : StarteErkennung (Modus=kontinuierlich, Lexi- 
kon=Kernvokabular) 

DM — > E4 : start eErkennung (Modus=Schlusselworterkennung, Lexi- 
kon=Vertrieb und Kundenservice) 

E3 -» MA: ErkennerAusgabe (Modus=kont inuierlich, Resultat="den 
Vertrieb bitte") 

E4 -> MA: ErkennerAusgabe (Modus=Schlusselworterkennung, Re- 
sultat="Vertrieb" ) 

MA — > DA: Eingabezeichenf olge (Vertrieb) 

DA MA: GebeAus ("Ihr Geburtsdatum bitte") 

MA -> Al: PlayPromptFile (Ihr_Geburtsdatum_bitte) 

DA — » MA: ErkenneAulierung (Domane=Datum) 

DM E5: StarteErkennung(Modus=kontinuierlich, Lexi- 

kon=Datumsangabe ) 

E5 -» MA: ErkenneAusgabe (Modus=kontinuierlich, Resultat l="am 
ersten ersten neunzehnhundert funf zig" , Resultat 2="am ersten 
elf ten neunzehnhundert funf zig" ) 
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MA -> DA: Eingabezeichenfolge (am ersten ersten neunzehnhun- 
dertfiinf zig) 

DA -» MA: GebeAus ( "Sie sind am ersten ersten neunzehnhundert- 
funfzig geboren" ) 
5 MA A3: ConcatAusgabe ( Sie_sind_am ersten, ersten, neunzehn- 
hundertfiinf zig, geboren) 
A3 MA: PlayPromptConcatComplete 
MA DA: AusgabeComplete 

DA -» MA: ErkenneSprache (Domane=j /n-Frage) 
10 MA — > E6 : StarteErkennung (Modus=Einzelwort , Lexikon=(ja, 
nein) ) 

In diesem einfachen Beispiel weisen die Spracherkennungsmodu- 
le Ei die folgenden einfachen Spracherkennungscharakteristika 
15 auf: 

Das Spracherkennungsmodul El ist als Einzelzif f ernerkenner 
ausgestaltet, E2 als Spracherkennungsmodul zur Erkennung kon- 
tinuierlicher Ziffern, also von Zif f ernketten . Das Spracher- 
kennungsmodul E3 ist als Spracherkennungsmodul zur Erkennung 

20 flieliend gesprochener Sprache mit einem begrenzten Vokabular, 
dem Lexikon „Kernvokabular" , ausgestaltet. Das Spracherken- 
nungsmodul E4 ist als Schlusselworterkenner mit dem Lexikon 
"Vertrieb und Kundenservice" ausgestaltet, das Spracherken- 
nungsmodul E5 ist als ein Spracherkennungsmodul zur Erkennung 

25 von vorgegebenen Wortkombinationen, in diesem Spezialfall zur 
Erkennung von einer Datumsangabe ausgestaltet. 

Die verwendeten Sprachausgabemodule Aj sind in diesem einfa- 
chen Beispiel als Modul zur Ausgabe vorgegebener, gespeicher- 
30 ter Sprachkonserven (Al), ein Modul zur Synthetisierung von 
Sprache aus beispielsweise Phonemen (A2) sowie ein Modul zur 
Ausgabe zusammengeset zter einzelner vorgegebener, gespeicher- 
ter Sprachkonserven (A3) ausgestaltet. 



35 Wie aus diesem einfachen Beispiel ersichtlich wird, wird je- 
weils dem Mittel MA von den Spracherkennungsmodulen Ei die 



WO 98/10413 



PCT/DE97/01920 



18 

Ergebnisse der Spracherkennung bzw. von den Sprachausgabemo- 
dulen Aj das auszugebende Sprachsignal zugefuhrt. 

Andererseits wird von dem Mittel MA den einzelnen Modulen Ei, 
5 Aj die jeweilige zur Erkennung benotigte Information zuge- 
fuhrt, beispielsweise auch das in das Sprachverarbeitungssy- 
stem eingesprochene Sprachsignal. 

Eine weitere Weiterbildung des Sprachverarbeitungssystem und 
10 des Verfahrens zur Sprachverarbeitung ist darin zu sehen, daft 
das Sprachsignal auch von mehreren Spracherkennungsmodulen Ei 
oder Sprachausgabemodulen Aj gleichzeitig bearbeitet wird, 
und daft jeweils das beziiglich eines beliebigen Ahnlichkeits- 
maftes beste Ergebnis verwendet wird oder auch nur ein Ver- 
15 gleichsergebnis zur Erhohung der Erkennungssicherheit verwen- 
det wird. 

Dial ogabl auf s teuerung 

20 Mit der Dialogablauf steuerung DA wird ein vorgebbarer Dialog 
mit dem Benutzer B des Sprachverarbeitungssystems je nach der 
Anwendungssituation durchgef uhrt , und abhangig von der jewei- 
ligen Dialogssituation dem Mittel MA Steuerungsinf ormation, 
beispielsweise noch benotigte Information zugefuhrt. Weiter- 

25 hin wird in dieser Weiterbildung beispielsweise das Ergebnis 
der Spracherkennungsmodule in dem Mittel zur Dialogablauf- 
steuerung ausgewertet, was beispielsweise auf die folgende 
Weise erfolgen kann: 

30 Die Dialogablauf steuerung DA weist mindestens folgende Kompo- 
nenten auf, die miteinander gekoppelt sind, beispielsweise 
uber einen Bus BU (vgl, Figur 2): 
ein Eingabemittel EM, 
einen Eingabespeicher ESP, 
35 - eine Aktionsermittlungseinheit AE, 
einen Parameterparser PP . 
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Die Arbeitsweise der einzelnen Komponenten der Dialogablauf- 
steuerung DA werden im Zusammenhang mit den Verfahren zur Ab- 
lauf steuerung eines Dialogs mit dem Benutzer B im weiteren 
detalliert erlautert . 

Die Aktionsermittlungseinheit AE dient zum einen zur Ermitt- 
lung von Aktionshinweisen und zum anderen zur Ermittlung min- 
destens einer vorgebbaren Aktion, auf die durch den Aktions- 
hinweis hingewiesen wird. Die Aktion wird aus einer beliebi- 
gen Anzahl vorgebbarer Aktionen ermittelt . Verschiedene Ver- 
fahrensweisen zur Ermittlung der gesuchten Aktion, auf die 
durch den Akt ionshinweis hingewiesen wird, sind dem Fachmann 
bekannt . Einige beispielhaft dargelegte Moglichkeiten zu de- 
ren Realisierung werden jedoch im Zusammenhang mit dem Ver- 
fahren detailliert erlautert. 

Der Parameterparser FP dient zur Ermittlung von Aktionspara- 
metern, die jeder Aktion jeweils eindeutig zugeordnet sind, 
aus der in dem Eingabespeicher ESP gespeicherten digitalen 
Aktionsinf ormation . 

In Figur 2 ist die Dialogablauf steuerung DA mit einigen Wei- 
terbildungen der Dialogablauf steuerung DA zur Aktionsermitt- 
lung dargestellt. 

Eine in einer Ausgestaltung vorgesehene Inf ormationsdatenbank 
ID enthalt jeweils anwendungspezif isch gesuchte Information, 
die anhand der bestimmten Aktion und den anschlieftend fur die 
Aktion ermittelten Aktionsparameter ermittelt wird. 

Es ist in einer Weiterbildung eine Aktionsklarungseinheit AKE 
vorgesehen zur Ermittlung weiterer Aktionshinweise von dem 
Benutzer. Die Aktionsklarungseinheit AKE gewinnt vor allem in 
Anwendungsgebieten eine erhohte Bedeutung, wenn es gilt, un- 
ter verschiedenen Aktionen die gesuchte Aktion zu ermitteln. 
Sind die Aktionshinweise, die von dem Benutzer B der Dialo- 
gablauf steuerung DA iibergeben werden, zur Bestimmung der Ak- 
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tion nicht ausreichend, so wird die Aktionsklarungseinheit 
AKE zur Ermittlung weiterer Aktionshinweise von dem Benutzer 
B verwendet. Die Ausgestaltung der Aktionsklarungseinheit AKE 
wird im Zusammenhang mit dem Verfahren naher erlautert. Es 
5 ist jedoch nicht notwendig, daii die Aktionsklarungseinheit 
AKE genau eine Aktion ermittelt. Es ist ebenso vorgesehen, 
die Anzahl vorgegebener Aktionen in einer beliebigen Art zu 
reduzieren, um somit nur noch eine geringere Anzahl von Ak- 
tionen weiter zu verarbeiten. 

0 

In einer Weiterbildung ist eine Parameterklarungseinheit PKE 
vorgesehen zur Ermittlung weiterer Aktionsparameter von dem 
Benutzer B . Die Parameterklarungseinheit PKE wird verwendet, 
wenn fur die mindestens eine ermittelte Aktion nicht alle Ak- 
5 tionsparameter, die den jeweiligen Aktionen zugeordnet sind, 
bestimmt werden konnen. Fur diesen Fall ist es vorteilhaft, 
dali die Parameterklaruungseinheit PKE verwendet wird, um feh- 
lende Aktionsparameter von dem Benutzer B zu ermitteln. 

20 In einer Weiterbildung der Dialogablauf steuerung DA ist es 

ferner vorteilhaft, einen ersten Aktionsspeicher AS1 und/oder 
einen zweiten Aktionsspeicher AS 2 vorzusehen. In dem ersten 
Aktionsspeicher AS1 werden Aktionen und deren Aktionsparame- 
ter gespeichert, bei denen der mindestens eine Aktionshinweis 

25 vollstandig mit mindestens einem Teil von Schliisselbegrif fen, 
deren Bedeutung im weiteren beschrieben wird, ubereinstimmt . 
In dem zweiten Aktionsspeicher AS 2 werden Aktionen und deren 
Aktionsparameter gespeichert, bei denen mindestens einer der 
Aktionshinweise mit mindestens einem Schliisselbegrif f iiber- 

30 einstimmt. 

Ferner ist in einer Weiterbildung ein Mittel GF zur Generie- 
rung von Fragen (prompts) an den Benutzer B zur Ermittlung 
weiterer Aktionshinweise und/oder weiterer Aktionsparameter 
35 vorgesehen. Der Aufbau des Mittels GF zur Generierung von 
Fragen ist beispielsweise aus dem Dokument [3] bekannt . 
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Ferner ist es in einer Weiterbildung der Dialogablauf steue- 
rung DA vorgesehen, eine Steuerungseinheit STE zur Steuerung 
einer Hintergrundanwendung HA unter Verwendung der ermittel- 
ten Information zu verwenden. Der Aufbau der Steuerungsein- 
5 heit STE ist vollig anwendungspezif isch und dient lediglich 
dazu, die ermittelte Aktion zur Steuerung der Hintergrundan- 
wendung HA zu verwenden. Die unterschiedlichen Verwendungs- 
moglichkeiten und somit auch die unterschiedlichen Ausgestal- 
tungen der Steuerungseinheit STE werden im weiteren detail- 
10 liert beschrieben. 

Ferner ist in einer Weiterbildung ein Schlusselbegriff editor 
SE vorgesehen, mit dem zum einen die im weiteren beschriebe- 
nen Schlusselbegrif f e und zum anderen neue Aktionen und/oder 
15 Aktionsparameter verandert, entfernt oder hinzugefiigt werden 
konnen . 

Die einzelnen Verf ahrensschritte des Verfahrens sind in Figur 
3 dargestellt * 

20 

In einem ersten Schritt 301 wird von dem Benutzer B der Dia- 
logablauf steuerung DA Aktionsinformation, die mindestens ei- 
nen Aktionshinweis aufweist, ubergeben. Das Verfahren mufi 
nicht notwendigerweise mit der im vorigen beschriebenen An- 
25 wendung durchgefuhrt werden, es ist ebenso moglich, das Ver- 
fahren mit Hilfe eines Rechners durchzuf Uhren . 

Die Aktionsinformation wird von dem Benutzer B an die Dialo- 
gablauf steuerung DA oder das Sprachverarbeitungssystem uber- 

30 geben. Die Aktionsinformation wird digitalisiert und als di- 
gitalisierte Aktionsinformation gespeichert 302. Die digitale 
Aktionsinformation kann beispielsweise in einer Phonemdar- 
stellung oder auch in Form eines ublichen Codes zur Darstel- 
lung von Schrif t zeichen (beispielsweise ASCII-Code) gespei- 

35 chert werden. 
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in einem weiteren Schritt 303 wird aus der gespercherten Ak- 
tionsinf ormation unter Verwendung des Parameterparses PP. 
dessen Aufbau beispielsweise aus de- Decent [.] bekannt 
1st, mindestens ein Aktionshinweises ermittelt. 

Unt er Verwendung des Aktionshinweises und der Aktionsermitt- 
lung.einh.it AE wird mindestens eine Aktxon bestrnunt 304 . 

Die Bestimmung der mindestens einen Action kann auf 
schiedliche Weise erfolgen. Eine sehr einfach 3 edocn « kein 
ster Weise ausschlieBlich verwendbare Methode liegt darin, 
ieder Aktion eine vorgebbare Anzahl von SchlUsselbegrrf fen, 
die jeweils die Aktion charakterisieren, zuzuordnen, und die 
aus der Aktionsinf ormation ermittelten Aktionshinweise, die 
durch den Parameterparser PP ermittelt werden, mit den 
SchlUsselbegriffen zu vergleichen. Der Vergleich kann durch 
einen direkten wortvergleich Oder auch durch einen beliebxgen 
Mustervergleich, deren Algorithmen jedem Fachmann gelaufxg 
sind, erfolgen- 

1st die mindestens eine Aktion ermittelt worden 304, werden 
fur alle Aktionen die Aktionsparameter , die den Aktionen em- 
deutig zugeordnet sind, aus der digitalen Aktionsinf ormatxons 
mittels des Parameterparser PP ermittelt 305. Anhand der er- 
mittelten Aktion sowie der zugehorigen Aktionsparameter wxrd 
nun in einem letzten Schritt 306 die Aktion durchgefuhrt . 

in einer Weiterbildung des Verfahrens wird Information zu der 
Aktion aus der Inf ormationsdatenbank ID ermittelt und dem Be- 
nutzer B uber die Ausgabeeinheit AUS dargestellt . 

Reichen die in der digitalen Aktionsinf ormation enthaltenen 
Aktionshinweise nicht fur die Ermittlung mindestens einer Ak- 
tion aus 401, so ist es in einer Weiterbildung vorgesehen, 
weitere Aktionshinweise beispielsweise durch einen Dialog mit 
dem Benutzer B zu ermitteln 402. 
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_ B urit er Verwendung der Aktionsklarungsein- 
n I^'aT dL vo-.gsweise — ausgestaltet ist da» «r 

k n*n Aktionen ieweils mindestens ein Ermitt lungs- 

die vorgegebenen AKtionen J ewcAX 

prompt eindeutig zugeordnet ist. Unter den Ermittlungsprompt 
5 ^beispielsweise Fragen zu verstehen, die der ^ewerlrgen 
Aktion zugeordnet und fest gespeichert sind. '"^^ 

H om Rpmitzer B bei unzureichender intor 
hmasDrompts werden a em Benuizer 

ZTZ J Ermittlung der AKtionen dargestellt. Der Benutzer 
B gibt auf diese Ermittlungsprompts, also die entsprechenden 
10 Frlgen, Antworten, die dann wiederum verarbeitet werden wo- 
7ZI weitere Aktionshinweise .-ltt.lt werden Der Dialog 
wird solange durchge £(i hrt und wiedernolt, bis <U. 
Aktionshinweise und weiteren Alctionshinwe.se ausre.chend srnd 
zur Identifikation der vorgebbaren Anzahl von Aktronen. 

15 Is t die mindestens eine Aktion .ndtt.lt, werden fur jede Ak- 
tion die Aktionsparameter, die der jeweiligen Aktion zugeord- 
net sind, ermittelt 305. 

Sind jedoch nicht alle benotigten Aktionsparameter vollstan- 
dig aus der in dem Eingabespeicher ESP erraittelten digitalen 
Aktionsinformation bekannt bzw. ermittelt worden, was xn ei- 
nem zusatzlichen Verf ahrensschritt 403 gepruft wird, werden 
die restlichen Aktionsparameter beispielsweise yon der Para- 
25 meterklarungseinheit PKE ermittelt 404. 

Dies geschieht beispielsweise ebenfalls in einem Dialog mit 
dem Benutzer B. FUr diesen Dialog konnen wiederum den ernzel- 
nen Parametern zugeordnete Prompts, im folgenden als Parame- 
30 ter-Prompts bezeichnet, verwendet werden, die bei notwendxger 
Ermittlung der entsprechenden Aktionsparameter an den Benut- 
zer B ausgegeben werden und der Benutzer B antwortet auf die 
entsprechenden Fragen. 

35 Sowohl die Ermittlung weiterer Aktionshinweise 402 als auch 
die Ermittlung der restlichen Aktionsparameter 404 kann je- 
doch auch auf andere Weise erfolgen. 
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Beispielsweise ist es nicht unbedingt notwendig, test vorge- 
gebene Ermittlungs-Prompts oder Parameter-Prompts den einzel- 
nen Aktionen bzw. Parametern zuzuordnen, wodurch zuiu einen 
zwar die Einfachheit in der Durchfuhrung des Verfahrens und 
in der Anpassung der jeweiligen Anwendung und die Erweiter- 
barkeit der Aktionen und Parameter erheblich vereinfacht 
wird, jedoch immer nur fest vorgegebene Fragen an den Benut- 
zer B gestellt werden. 

Es ist in einer Weiterbildung des Verfahrens und der Dialo- 
gablaufsteuerung DA vorgesehen, das Mittel GF zur Generierung 
von Fragen an den Benutzer B zu verwenden. Eine Moglxchkext 
zur Realisierung des Mittels GF ist beispielsweise in deiu Do- 
15 kument [3] beschrieben. 

in einer Weiterbildung des Verfahrens ist vorgesehen, zur Er- 
mittlung der Aktion in der Akt ionsermittlungseinheit AE fol- 
gende Schritte durchzufuhren . In der Aktionsermittlungsem- 
20 heit AE wird fur jede Aktion der Vergleich der Schlusselbe- 
griffe mit den Aktionshinweisen durchgefilhrt . 

Es wird eine erste Menge von Aktionen ermittelt, bei denen 
alle Aktionshinweise mit mindestens einem Teil der Schlussel- 
begriffe ubereinstimmen . Anschaulich beschrieben bedeutet 
diese Vorgehensweise, daft die Schnittmenge aller Aktionen, 
auf die durch die Aktionshinweise hingewiesen wurde, ermxt- 
telt wird. Die erste Menge von Aktionen wird beispielsweise 
in dem ersten Aktionsspeicher AS1 gespeichert. 

Ferner wird eine zweite Menge von Aktionen gebildet, bei de- 
nen mindestens ein Teil der Aktionshinweise mit den Schlus 
selbegriffen ubereinstimmt . Diese Vorgehensweise bedeutet an 
schaulich eine Bildung der Vereinigungsmenge aller Aktionen, 
auf die hingewiesen wurde. Die zweite Menge von Aktionen wxrd 
beispielsweise in dem zweiten Aktionsspeicher AS 2 gespei- 
chert . 
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B»th.lt die erste Menge ,enau ein Element so » * • z « 
rai ttelnde Action eindeutig identif iziert . Fur dresen Fall 
Tein "eiterer KlSrungsdialog notwendig. Enth.lt d.e erste 
„enge iedoch mehr El.mente als die Anzahl von zu err^ttelnden 
Ttionen, so ist die Aktion durch die initiale Benutzeremga- 
te nicht genau genug beschrieben. In diesem Fall »t es vor- 
Teilhaft, den 1» vorigen beschriebenen Klarungsdralog durch- 

zufiihren. 

' „ t die erste Menge eine leere Menge, so enth.lt die initiale 
BenutzerauAerung Hinweise auf disjunkte Aktionen^ In drese, 
Fall wird vorteilhafterweise der Klarungsdralog durch die xn 
der zweiten Menge enthaltenen Aktionen gesteuert. 

5 Sind sowohl die erste Menge als auch die zweite Menge leere 
Mengen, so «ird beispielsweise ein Klarungsdialog zur Unter- 
scheidung aller in der Anwendung bekannten Aktionen durchge- 
f iihrt . 

Somit dienen die erste Menge und die zweite Menge in dieser 
Weiterbildung als Grundlage fur den Dialog mit dem Benutzer B 
zur Ermittlung der mindestens einen Aktion. 

,5 Die ealtt.lt. Aktion kann in einer Weiterbildung des Verfah- 
rens vorteilhaft zur Steuerung mindestens einer Hintergrund- 
anwendung HA eingesetzt werden. 

Unter der Hint ergrund anwendung HA sind unterschiedlichste 
30 Einsatzmoglichkeiten des Verfahrens und der Dialogablauf - 

steuerung DA zu verstehen, die im weiteren erlautert werden. 

DaS Verfahren sowie die Dialogablauf steuerung DA konnen bei- 
spielsweise in folgenden Gebieten vorteilhaft eingesetzt wer- 

35 den: 

in einem Telef ondienst , 
- in einem Telekauf-System und/oder Tele-Banking-System, 
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Voice Mail Handling System, 
" in 6inem S ° g a ^« beliebigen Maschine, beispielsweise 
zur Steuerung einer Dexieu y 
einer Werkzeugmaschine oder eines Roboters, 

9i-pnpruna eines Rechners, 
zur Steuerung Keb enstellenanlage ernes 

in einem Messagmg-System eme 
Telekommunikationssystems . 

, ,t es in einer Weiterbildung des Verf ahrens vorteil- 

tion J-^f- Keihenfolse .~itt.lt werden. 

4. * r Auswertung der Aktionsinf ormation am 

^ g der L^onsinformatien ^t.r,.«hrt wird. Durch d.ese 
v" eKensweise wi,d eine Korrefctur ^ ^ 
d»r!h den Benutzer B in einem Satz m6glxch, was i. fol.enden 
noch detalliert erlautert wird. 

Zum einfacberen Verstandnis der ^^'^^^^ 
im folgenden ein sehr einfaches Bexspxel aus der Tourists 
Zl Je dargestellt. Beispielsweise _ in diesem Anwen- 
dungsgebiet folgende Aktionen definiert sexn: 

- Auskunft ilber Bahnverbindungen; 

- Auskunft fiber Flugverbindungen; 

- Auskunft uber Schif f sverbindungen; 

- Auskunft iiber Hotelzimmer; 

- Restaurant information. 

Die einzelnen Aktionen konnen beispielsweise durch folgende 
Parameter gekennzeichnet sein; 

- Bahnauskunft: <Abf ahrtsort>, <Ankunf tsort>, <Datum>, 

<Uhrzeit> 

- Flugauskunft: <Abf ahrtsort>, <Ankunf tsort>, <Datum>, 

<Uhrzeit> 
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Schi£t saus>cun t t= <abf.hrt.ort>. <^»«.ort>. -at™. 

<Uhrzeit> 

Datum> 

. nrt -> <stil>/ <Kategorxe>. 
Restaurantinformatxon: <Ort>, 

rier ieweilxge Ermxttxungs f 
Punkt 2.2 der ]e y me . prsDe zif ikationen, die sich, De- 

o -3 die einzelnen Parameterspezm^v. 
me r 2.3 dxe exn definier ten Grammatik in diesem Fall 

wei ls abhangxg von der definl ^t Weise darst ellen, 

»r vorgegeoene ™ t -™ t ^ d ^^ nlct 3.3 die jewex- 
dafi r il ; , unt « ; ^ e -^x^para^ters gegeben i.t 
» fu r P - 3- - Parameter-Prompt darge- 



stellt ist 
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ktion (Bahnauskunf t ) 

{2 .l: Nummer - 1 , Mocht en Sie eine Bahnauskunf t 

2.2: Ermittlungs-prompt - Mocnten 

einholen? ' 

2 3 - Parameterspezif ikationen - {parameter 

{3.1: g_abfahrt(X) 

3.2: 'Bitte nennen Sie 

den gewunschten Abf ahrtsort . ' 

3.3: g_ort(X) 
} 

parameter 

{3.1: g_ankunft(Y) 
3.2: 'Bitte nennen Sie 

den gewunschten Ankunf tsort . ' 

3.3: g_ort(Y) 

} 

parameter 
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wollen Sie f ahren? ' 



len Sie f ahren?' 



{3.1: g_datum(Z) 

3.2: 'An welchem Datum 

3.3: g_datum ( Z ) 
} 

parameter 

{3.1: g_uhrzeit(W) 

3.2: 'Um wieviel Uhr wol- 

3.3: g_uhrzeit(W) 
} 



i ~ nar h f ahren, Zugauskunft, 
2.4: Aktionshinweise = (von, nach, tahren, 

Eisenbahn, Bahnauskunf t } 
2 5: Be st at igungs -prompt = 

. sie erhalten Auskunft uber die Zuge von X 

nach Y am Z um W Uhr . ' 
} 



20 

aktion (Flugauskunf t ) 

{2 .l: Nummer =2 , M5chte n Sie eine Flugauskunf t 

2.2: Ermittlungs-prompt - Mocnren 

einholen? 1 

26 2 3: Parameterspezifikationen = {parameter 

" {3.1: g_abfahrt(X) 

3.2: 'Bitte nennen Sie 

den gewunschten Abf lugort . ' 

3.3: g_ort (X) 
) 

30 

parameter 

{3.1: g_ankunft(Y) 
3.2: 'Bitte nennen Sie 

den gewunschten Ankunftsort. ' 

3.3: g_ort(Y) 

35 , 

parameter 
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{3.1: g_datum(Z) 

3.2: 'An welchem Datum 

wollen Sie fliegen?' g _datum(Z) 

} 

5 parameter > 

(3.1: g_uhrzeit(W) 

3.2: 'Urn wieviel Uhr wol- 
len Sie fliegen?' 3 ^ g _ uhrzeit(W) 
10 } 

2.4: Aktionshinweise - (von, nach, fanren, fliegen, 
Flugauskunft, Flugzeug} 
15 2 . S : B..t»t^.-P = -^^^^ die F1Uge von x 

nach Y am Z um W Uhr . ' 

> 



20 

aktion (Schiffsauskunft) 

{2 .l: Nummer =3 , Mochte n Sie eine Schiffsaus- 

2.2: Ermittlungs-prompt - Mocnten 

kunft einholen?' 
25 2.3: Parameterspezifikationen - {parameter 

zo {3.1: g_abfahrt(X) 

3.2: 'Bitte nennen Sie 

den gevrtinschten Abfahrtsort . ' 

3.3: g_ort(X) 
} 

parameter 



{3.1: g_ankunf t ( Y ) 
3.2: 'Bitte nennen Sie 



den gewunschten AnKunftsort . ■ ^ ^ ^ 
35 , 

parameter 
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{3.1: g_datum(Z) 

3.2: 'An welchem Datum 

wollen Sie f ahren? • ^ g _ dat um(Z) 

} 

parameter 

{3.1: g_uhrzeit (W) 

3.2: 'Urn wieviel Uhr wol- 
len Sie fahren?' „. f (M1 
- LtJl 3.3: g_uhrzeit{W) 

} 

2.4: Aktionshinweise - (von, nach, fahren, Schiffsaus- 
Jcunft, Schiff} 

von X nach Y am Z urn W Uhr. ' 

} 



a 



30 
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ktion (Hotelauskunft) 

(2 1 ■ Nummer =4 
2.2: E r m i t tlun g s-pr M pt - ^chten Sie eine HotelausKunf t 

einholen? ' 

2.3; Parameterspezifikationen = {parameter 

{3.1: g_ortsangabe (X) 

3.2: 'In welchem Ort su- 

chen Sie ein Hotel?' . 

3.3: g_ortsangabe (X) 

} 

parameter 

{3.1: g_zimmerart (Y) 
3.2: 1 Suchen Sie Einzel- 

zimmer oder Doppelzimmer? ' 

3.3: g_zimmerart (Y) 

} 

parameter 



WO 98/10413 



PCT/DE97/01920 

31 



10 



20 



25 



30 



nen suchen Sie Zimmer 



einchecken?' 



15 schecken?' 



{3.1: g_anzahl_personen(Z.) 

3.2: 'Filr wieviele Perso- 

3.3: g_anzahl_personen(Z) 
} 

parameter 

{3.1: g von_datum(W) 

3.2: 'Wann wollen Sie 

3.3: g_datum(W) 
} 

parameter 

{3.1: g_bis_datum(V) 

3.2: 'Wann wollen Sie au- 

3.3: g_datum(V) 



} 



} 



35 



- f Hotel, Unterkunft, Einzelzimmer , 
2.4: Aktionshmwexse = {Hotex, 

Doppelzimmer, Zimmer) 

2 5- Bestatigungs-prompt = 

•Sie erhalten AusKunft U ber Hotel, in X, dxe Y fur 

tvj >-\-i <= zum V frei haben.* 
Personen vom w dis zum 

} 



aktion (Restaurantinformation) 

{2 .l: Nummer =5 , Mocnte n Sie eine Restaurantin- 

2.2: Ermittlungs-prompt - Mocnten 

formation einholen? ' 
2.3: Parameterspezifikationen = {parameter 

{3.1: g_ortsangabe (X) 

3.2: 'In welchem Ort 

m 6chten Sie essen gehen? ' ^ ^ ^ 

) 



parameter 
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{3.1: g_stiim 
3.2: 'Bitte nennen Sie 

den gewiinschten Stil.' ^ ^ g _ sti l(Y) 

} 

^ parameter 

{3.1: gJcategorie(Z) 

3.2: 'Bitte nennen Sie 

die gewunschte Kategorie.' ^ ^ g _ kategQrie (Z) 

10 } 

} 

• ^ _ inpqtaurant, essen} 
2 4- Aktionshinweise - {Restaur* 

tegorie in X. ' 
} 

, n H,n Tabelle sind Schlusselbegrif f e fttr die ein- 
I„ der folgenden e entsprechende Nu^uer in den 

20 zelnen Aktxonen, dxe durcn dxe y beispiel- 

geschweiften Klammern eindeutxg xdentxf xzxert 

haft aufgefuhrt. 



15 



von 
25 nach 

f ahren 



30 



{1, 2, 3} 
{1, 2, 3} 
(1, 2, 3} 



Zugauskunft I 1 ) 

Eisenbahn i 1 ) 

fliegen ( 2 ) 

Flugauskunft ( 2 ) 

Flugzeug 

Schiffsauskunft {3} 



Schif f 
Hotel 
35 Unterkunft 

Einzelzimmer 
Doppelziinmer 



(3> 
{4} 
{5} 
(4> 
{4} 
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Restaurant 

{5} 

Essen 1 3 

■ -> ^ = <= nonntzers B mit der Dialo- 
Ein Beispiel fUr einen Dialog des Benutzers 

Em tJeisp folgenden dargestellt . 

gablaufsteuerung DA wird im i^y 

* suliert seinen Wunsch prazise und vollstandig. 
Der Benutzer B auftert seme 

folnende Inf ormationen ein: 
Der Benutzer B «^J^£ 6 um 5 . 00 uhr mi t de . 2 u 9 von 

„lch mochte am 1 . Januar 
Miinchen nach Hamburg fahren." 

. hBr nsi enthalt unter Verwendung der 
De r -ste Ak t,onss P e,che A 81 « ^ die er _ 

oben beschnebenen Schluss g Aktionsspeiche r AS2 

ste Menge von Aktionen uer 

enthalt die zweite Menge von Aktionen (1, 2, 3). 

a<51 aenau ein Element aufweist, 

irenLn, X, die g esuc h te ^ 
, om Rpnutzer B durch folgende Antwort darge 
spielsweise dem Benutzex d 



S st"« h .lt.n R us k unft U ber die Fl* g e von Manchen nacn Ha*- 
'CZ am 1. ^nuar 1^ u m «nf unr: .1. Flu,. 2. Flu,, 3. 

2 5 Flug usw, . xv . 

Bei .tw» weiteren BeispieX nennt der Benutzer B weder Unr- 
zeit noch Verkehrsmittel : 

■ ^ „4--i«r> i «5t beispielsweise folgende: 
30 Die Aktionsmformation ist beispie „ Klll _„ « 

i T=nuar 1996 von Miinchen nach Hamburg. 
„Ich mochte am 1. Januar i»»o 

• •l- 7\ci ont-halt in diesem Fall die er- 
Der erste Aktionsspeicher AS1 enthalt m 

, . , n o -a\ ner zweite Aktionsspeicher 

ste Menge von Aktionen {1,2,3}. Der 
35 AS2 enthalt die zweite Menge von Aktionen {1,2,3} In der 
35 AS2 entnax Klarungsdialog initnert, 

Dialogablaufsteuerung DA wird em m y 

, n o o\ zu unterscheiden . 
um zwischen den Aktionen (1,2,3) zu u 
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Hierzu wird beispielsweise der oben bescnriebene Er.ittlungs- 

Prompt: w 
„Mochten Sie eine Bahnauskunf t - 
dem Benutzer B ausgegeben. 

Der eenutzer B antwortet bexspielswexse mit „Nein« . 

, . sem Fall wird von der Dialogablauf steuerung DA bei- 
r P ir s :iI S e f0l gen d er Brmittlungsprompt ausgegeben: 
„M6chten Sie eine Flugauskunft ?* 

Beantwortet der Benutzer B diese Frage mit ^ 

we-rer Kl.rungsdiaXog zur ^^ ^^ 

f ehlenden AXtionsparameter fur dx > * Akt ionsparame- 

Hierbei wird beispielswexse zur Ermxttlung 

ters Uhrzeit der Parameter-Prompt: 

//Uro wieviel Uhr mochten Sie fliegen? 

dem Benutzer B ausgegeben. 

Der Benutzer B antwortet beispielsweise : 
„Um funf Uhr. xx 

~ nn anqreichend information/ 
Nu n nat die Dialogablauf steuerung DA £^ wlrd dem 

; un, die gesuchte Action zu "=»"" ln - ^..t.llt = 

Benutzer B beispielsweise in nach Ham - 

„Sie erhalten Auskunft uber dxe Fluge von 

1 Taniiar 1996 um funf Uhr". 
burg am 1. Januar ±=>*v 



30 



35 



n rails uber eine mogliche Ausgestaltung der Dxalo- 
Wextere ataxia uber e g Deutschen Pa tentanmeldung mxt 

gablaufsteuerung DA sxnd ^ bes chrieben. 
dem amtlichen Aktenzexchen 19615693. 

In Fi g. 4 1st in eine, ^^^^^^^ 
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i,n e Art von Spracherkennung und/oder welche Art von 
welche Art von *P Ver fahren ben6tigt wird 401. 

Sprachausgabe liti weiteren 

. r wird abhangig von dem Eingabesignal ES ruindestens ein 
Ferner wxrd abhang g Sprachausgabemodul Aj 

Spracherkennung smodul Ei una/oaei 

aktiviert 402. 

ist es in einer Weiterbildung vorgesehen, gemeinsame 
Ferner xst ea xn ein geme insame " Teile von Algo- 

5 cherkennung gieicnzeiuxy 

Vorverarbeitungsniodul W durchzufuhren. 

ln der gemeinsamen Vorverarbeitung z. B. in mindestens einem 
Vorveraleitungsmodul W kennen beispielsweise erne akustx- 
0 Iche vorverarbeitung Oder eine so,. Abstandsberechnun, der 
untersuchten Teile des Sprachsignals realisiert werden. 

Perner 1st es in einer Weiterbildun, vorteilhaft, 
gemeinsam zu nutzen, beispielsweise in exner Werse, daft em 

,5 Likon von mehreren spracherkennungs.odulen Er 

verwendet wird. Pies ist beispielsweise .eglxch, xnde* .xn 
Lexicon zur Erkennung flie.end gesprochener Sprache u. dxe 
Worte "Ja" und "«ein" enthalt, wodurch es moglrch xst, da* 
auch ein SchlOsselwort-Erkenner (Keyword-Spotter) auf dre Be- 

30 griffe "Ja" und "Nein" zur DurchfUhrung der Spracherkennung 
in diesem Fall auf dasselbe Lexikon zugreifen kann. 

Auch eine gemeinsa.e Nutzung von Ressoucen bei der Nachbear- 
beitung sind sowohl bei dem Verfahren als auch mxt ernem 
35 Nachbearbeitungsmodul bei dem Sprachverarbeitungssystem als 
eine Ausgestaltung vorgesehen. 
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Spracherkennung und m der sp auch zur Br - 

„ g eines Di.l°,. ~' ^^^t we.dsn, da eine 
stellun. von ^^^{^Z, anwendun.sspezifischen 

gabemodulen moglich xst. 
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* „ fnloende veroffentlichungen zi- 
in diesem Document wurden folgende 

tiert: 

„, G RusKe, Automatische spracherkennung, Oldenbourg- 
11 verla, 1. Auflage, 3-486-20877- 2 , H Un c he n, 

S. 106 - 171, 1988 

i ^r- Mei-7e Edison Wesley, 
[2) A. Simulation "! "37 - 143. 199* 

1. Auflage, ISBN 3-89319-554-8, S. 137 

0 <» — r : t ^::;rr::.rrrr:nr; to ai e 

i_ ^^-.r^rt q^ktion ComputerlinguistiK, 
fiir sprachverarbeitung, Sexxion ^ f 

5 4. Fachtagung, S. 1 - 6 

[41 _ svenun, H T=:: »- 3 ^' lM .„. 
Stuttgart, Teubner, 1. Auflage, 

S. 155 - 166 
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1. sprachverarbeitungssystem, und /oder 

mit mehreren Spracherkennungsmodulen (Ex, x l..n) 
- mit menreiw v ieweils fttr eine vor- 

h» vorqesehen sind, und 

be vorge Auswa hl mindestens exnes Spra- 

L weiteren durchzufuhrende Spracherkennung und/oder 
Sprachausgabe, abhangig von exnem Eingabesxgnal [E8 , «t 
beschrieben wird, welche Art von Spracher*ennung und/oder 
sprachausgabe im weiteren benotigt wird. 

, sorachverarbeitungssystem naoh Anspruch 1, 

• I Zl Mittel (MA) zur Auswahl des Sprachertennungsmo- 
ZsZi unX r des Sprachausgabemoduls (W , ^rart au.ge- 
ttaltet Lt, da. das spracher*ennungsmodul ,Bi) und/oder das 
Sprachausgabemodul ,A 3 , von dem Mitt el <MA, gesteuert wxrd. 

Sprachausgabemodul die gemeinsam verwendet warden, xn 

IZTsZl eine, vorverarbeitungsmodul <W> und/oder .» 
destens einem Nachbearbeitungsmodul realxsxert sxnd. 

4. sprachverarbeitungssystem nach Anspruch 3. 

be i Lm mehrere sprachericennungsmodule (Ex) und/oder Sprach 

ausgabemodule (AJ ) gemeinsame Ressourcen verwenden. 

' 5 . sprachverarbeitungssystem nach eine, der AnsprUche 1 bis 

bix dem eine Dialogablauf steuerung (DA, vorgesehen ist, mit 
der ein Dialog des Sprachverarbeitungssystems mxt exnem Be 
S nutzer (B) de Sprachverarbeitungssystems realisiert wxrd. 
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6 . spxachverarbeitungssyste. nach eine, der AnsprOcne 1 bis 

de , das Singabesignal von der o^ogabiau.steuerung 

(DA) erzeugt wird. 

6 narh einem der Anspruche 1 bis 

7. sprachverarbeitungssystem nacn einem 

6 ' . ^ Q qnracherkennungsmodul (Ei) mindestens zur 

- b6i ^ daS e ^e r der folgenden Arten der Spracherkennung 
Durchfuhrung exner der xo-i-y 

10 ausgebildet ist: 

- Einzelziffererkennung, 
Frkennung von Zif f ernketten, 

Erkennu g aus einem be grenzten Vokabular, 

- Erkennung von ^ ^ einem unbe grenzten Voka 
Erkennung ernes Einzeiwon. 

15 bular, . qn , ac h e mit einem unbe- 

- Erkennung flieftend gesprochener Spracne mi 

arenzten Vokabular, 

- Erkennung von vorgegebenen MortKomb^nat.onen, 
Scn lusselwort-Erkennung, 

20 Alphabeterkennung, 

Lautfolgenerkennung, 

Sprechererkennung, 

DTMF-Erkennung, 

und/oder 



TtTL das sprachausgabe-nodul -ndestens zur Durch 

^rung einer der foXgenden Arten der Spracnausgabe ausgeb 

dSt 1St: v. ^soeicherter sprachkonserven, 

ansaabe vorgegebener, gespeicner f 

— Ausgaoe y y .. 7elner vorgegebener, gespe 

— Ausgabe zusammengesetzter exnzelner vo y y 

30 cherter Sprachkonserven, isierten 

— Ausgabe von aus gespeicherten Phonemen synthetisierten 

Wort en, 

— Ausgabe von DTMF-Tonen. 

35 8 . Verfahren zur Sprachverarbeitung, 
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10 



>_ • =i (FSl analysiert wird (401), mit 
sprachausgabe in weiteren bendtigt wird, tens ein 

spracherlcennungsmodul (El) und/ „. Rrt ein er 

9 abe,aodui <*,. 4»<*»»U vorgesehen sind, 

Spracherkennung und/oder einej- * 

ak tiviert wird (402) , ™« sprache rKennun,smodul und/oder 

- b ei dem rait den, ausge wahlten Sp Spr acherkenn U ng 

i:^^^:^ - Vorverarbei.ng ,W, de S 
rkennenden Sprachsignals erfolgt. 



15 zu e 



m v^rfahren nach Anspruch 8 oder 9, 

"ei Zl TZ der spracherkennung eine Hacbbearbeitung das e, 

kannten Sprachsignals erfolgt, 
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FIG 3 



[ 



z 



301 



Obergeben von Aktionsinformation 

+ 

Speicherung von Aktionsinformation 



302 



Ermittlung von mindestens einem 
Aktionshinweis aus der 
AktinnRinformation 



303 



401- 



Nein 



dionshinweise ausreichen? 
'ur Ermittlung der AktionenJ, 



Ermittlung 
weiterer 
Aktionshinweise 



402 
•A 



Ja^ 



Ermittlung von Aktionsparametem zu 
der mindestens einen Aktion 



403 ^ =5 *<-- , " x ~*-^^_ Nein 
3<tionsparameter vollstandic 



404 



Ermittlung J' 
restlicher 
Aktionsparameter i 



Ja- 



-306 



Ausfuhrung der Aktion 
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FIG 4 



401 -J 


Analyse des Eingabesignais ES | 




402^ 


" Aktivierung mindestens emes 
Spracherkennungsmoduls und/oder 
- eines Sprachausqabemoduls 




i — 


403-x 


DurchfQhrung der jeweiligen 

Spracherkennung bzw. 
Sprachausgabe der jeweiligen 
Spracherkennungsmodule und/oder 
der Sprachausgabemodule 
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